Kaggle タイタニック号生存者のデータ分析入門をやってみた
2025-06-22
kaggle
ChatGPTを使って、タイタニック号のデータ分析入門について取り組んでみた。
実行環境はGoogle Colab
分析の方法について、結構親切に教えてくれたのでありがたかった。
分析の視点については、いろいろなデータを見ながら、トライ&エラーをしながら経験を身に着けていくしかなさそうだ。
ChatGPTが全部のデータを分析してくれるわけではなく「こんなことを分析してはどうか」という提案と、それに伴うコードの出力をやってくれる感じだった。
データ分析の目的を見失わずに、どのようなデータが関連していそうかは、自分で経験などを身につけて判断する必要がありそうだ。
■プロンプト例
あなたはプロのデータサイエンティストで、人にわかりやすく教えるプロです。私はデータサイエンスを勉強したい主婦です。一緒にデータ分析について、一から教えてください。今回学習のサンプルとして、タイタニック号の生存者の予測を行います。
ひとまずここまでのコードを書きました。
code:test.py
import numpy as np
import pandas as pd
import os
train.csv、test.csv、gender_submission.csvを読み込む
train_data = pd.read_csv("/content/drive/MyDrive/54_データサイエンス/titanic/train.csv")
test_data = pd.read_csv("/content/drive/MyDrive/54_データサイエンス/titanic/test.csv")
gender_submission = pd.read_csv("/content/drive/MyDrive/54_データサイエンス/titanic/gender_submission.csv")
train_data.head()